iT邦幫忙

2022 iThome 鐵人賽

DAY 6
0
AI & Data

機器學習的 hello world - 用手寫數字辨識系統學習 ML 的 30 天系列 第 6

[DAY6] 機器學習學什麼?釐清手寫數字辨識系統的學習情境與類型

  • 分享至 

  • xImage
  •  

我以李弘毅老師所開的機器學習課程學習地圖,作為機器學習會學哪些方法的架構介紹。

https://ithelp.ithome.com.tw/upload/images/20220920/20131719yPKP08XXBF.jpg

綜觀機器學習,我們可以分成學習情境(scenario)、任務(task)跟方法(method)三部分來看。


一、訓練時的學習情境(scenario)

從訓練時的學習情境(scenario)的角度,可以分成

  1. supervised learning: 給學習教材(input)跟答案標籤(output),像家教一樣的監督式學習
  2. semi-supervise: 只給教材(input)但只有部分有答案標籤的半監督式學習
  3. unsupervised learning: 給教材但不給答案的非監督式學習,想知道機器會做出什麼結果等
  4. reinforce learning: 學習過程中只告訴他分數結果,不跟它說到底錯在哪,讓機器自己去試錯修正的強化學習
  5. transfer learning: 用在其他數據/經驗(Source Data)來應用在我現在想學的目標(Target Data)的遷移式學習

https://ithelp.ithome.com.tw/upload/images/20220920/20131719LhMe8GmB4z.png
圖片來源:https://ithelp.ithome.com.tw/articles/10264258


二、資料輸出的格式(要做的任務, task)

而就資料輸出的格式來說(也可以說是要做的任務, task),可以分成:

  • 回歸(regression)問題:一個實數,譬如說天氣或股票數值預測
  • 分類(classification)問題哪個類型,是兩類還是k類(Binary or Multiclass),實務上的例子有像垃圾郵件、文章或情緒分類,下圍棋要下在棋盤上哪一格(可以看成要下一步要分在19x19的哪一類中)等
    還有輸出是結構序列形式(structure learning)的問題,不過這邊先跳過。

回歸主題,我們要做的手寫數字辨識系統是一個在訓練有預設答案(監督式)的分類問題,因為我們會給它input跟目標output的資料,確定得出的結果是數字 0~9 其中一個。


三、方法(method)

機器學習的方法有直接對照得到答案的線性模型,容易理解但正確率可能不高,也有過程比較複雜的非線性模型,如 Deep Learning(Neural Network),或是其他模型如 SVM、決策樹、K 鄰近法(K-NN) 等。

每種方法都有他們的優缺,按照遇到的問題選用最適合的模型(model) 即可,譬如說使用神經網路時因為黑箱關係,所以不大好解釋結果是怎麼一步一步推論出;或使用決策樹做分類時,若各類樣本數量不均,決策樹推論出來的結果會偏向樣本數量比較多數據的特徵,這些我們後面有機會會詳細講。


明天我們接著講怎麼找一個適合手寫數字辨識系統的神經網路方法~

[註1] 李宏毅老師的 機器學習課程(2017)


上一篇
[DAY5] 什麼是神經網路(Neural Network)?機器學習與深度學習的概念介紹
下一篇
[DAY7] 怎麼找適合的神經網路方法?以機器學習找方法三步驟解釋
系列文
機器學習的 hello world - 用手寫數字辨識系統學習 ML 的 30 天30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言